昨天把迴圈的前半部分,也就是讀取data的部分講完,接著講label讀取的部分。
build_voc2012_data.py
(cont.)不過我通常的做法是用try and except的方式去處理,因為有時候資料集很大,難免會有錯誤,處理到一半失敗的話,前面處理所花的時間就白費了,所以我會用try去忽略掉不能用的資料點。
接著是把訓練用的資料:data影像、影像資訊(長、寬、名稱)、label這些,全部轉成一組tf example格式。
build_data.py
tf example是有規定的儲存格式,他要儲存的是多個tf features,而feature是一個python的dictionary格式。
因為是dict,所以要指定'key 名稱'
,然後儲存的資料必須是轉成byte的資料。
這些名稱都可以自訂。
最後就把轉好的一個tf example轉成string後,再一筆一筆寫入tfrecord。